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摘要 : [目的 /意义 ] 数 据 故事 化 是 一 种 更 高 效 、 更 全 面 、 更 新 颖 地 展示 数据 分 析 结 果 的 方式 
通过 分 析 我 国 数据 故事 化 研究 的 代表 性 文献 ， 对 现 有 研究 成 果 进行 系统 梳理 ， 并 对 研究 
势 趋 进 一 步 展 望 ， 为 后 续 研 究 提供 借鉴 和 局 示 。 [方法 /过 程 ] 主 要 采用 内 容 分 析 法 归纳 我 
国 现 有 的 有 关 数 据 故 事 化 研究 的 21 篇 文献 内 容 ， 从 概念 内 涵 、 基 本 流程 、 相 关 模型 以 及 应 
用 实践 4 个 方面 对 我 国 数据 故事 化 的 研究 进展 进行 梳理 和 分 析 。[ 结 果 / 结 论 ] 数 据 故事 化 开 
究 在 我 国 尚 处 于 起 步 阶段 ， 在 内 涵 、 流程 、 模 型 、 方 法 、 工具 等 理论 研究 以 及 实践 应 用 领域 
存在 较 大 提升 空间 ， 未 来 研究 注重 构建 我 国 数据 故事 化 研究 的 自主 知识 体系 和 应 用 实践 


体系 。 

关键 词 ， 数据 叙事 ;数据 故事 化 ， 数 据 科学 ， 科 学 数据 ， 数 据 管理 
分 类 号 : G254 

1 引言 


2023 年 2 月 28 日 中 共 中 央 办 公 厅 印发 了 《数字 中 国 建设 总 体 规划 》， 大 力 推 进 数字 中 
国 建设 ， 提 出 数字 中 国 建设 是 数字 时 代 中 国 现代 化 建设 的 重要 引擎 ， 是 打造 国家 新 竞争 
力 的 强大 支柱 。 数 据 作为 一 种 新 型 的 生产 要 素 ， 充 分 利用 数据 资源 ， 是 推进 数字 中 国 建 设 
的 基础 。 然 而 ， 现 有 的 数据 存在 着 复杂 、 混乱 、 枯燥 的 问题 ， 公 众 难 以 获取 有 价值 的 数据 资 
源 ， 更 难以 揭示 数据 之 间 的 关系 ， 所 以 如 何 从 海量 的 数据 中 获取 价值 ， 并 将 这 些 价值 传 
递 给 人 ， 成 为 了 一 个 必然 需求 '。 数据 故事 化 (Data Storytelling〉 作 为 大 数据 时 代 的 一 项 新 
兴 课 题 ， 可 以 用 来 揭示 数据 之 间 的 隐藏 关系 ， 洞 察 数据 的 隐藏 价值 ， 为 数据 发 声 、 解 释 、 
说 服 和 引导 ， 提 高 公众 对 数据 的 接受 度 。 

目前 ， 国 外 关于 Data Storytelling 的 理论 和 实践 研究 都 取得 了 一 定 进展 ， 如 Dykes?“ 
提出 有 效 的 数据 故事 化 需要 通过 数据 、 叙 事 和 视觉 效果 来 驱动 ，Lee; 等 提出 了 发 现 见解 、 将 
这 些 见解 转化 为 故事 以 及 将 这 种 故事 传达 给 观众 的 数据 故事 化 流程 ，McDowell 等 描述 了 


! 本 文系 国家 社 科 基金 一 般 项 目 “ 科 学 数据 融合 模式 设计 与 体系 建构 研究 ”项 目 编号 : 21BTQ080) 的 研究 成 果 。 
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故事 化 如 何 扩展 数据 、 信 息 、 知 识 和 DKW 金字 塔 并 修订 了 一 个 新 的 S-DIKW 框架 ; 
Brolch&in; 等 分 析 了 现 有 的 开放 数据 平台 对 故事 化 的 支持 ， 认 为 YDS 平 台 可 以 月 
开放 数据 平台 开发 相关 故事 扩展 的 模板 ; Ojo* 等 分 析 了 GEN 数据 新 闻 奖 的 44 个 获奖 案 


例 ， 认 为 数据 故事 化 可 以 应 用 于 数据 新 闻 的 传播 ， Botsis' 等 提出 数据 故事 化 可 以 应 用 于 + 


作为 现 有 


IEK 


强生 物 医学 科学 的 知识 传播 。 我 国学 者 在 国外 研究 的 带动 下 也 对 数据 故事 化 展开 了 一 定 的 
探索 ， 主 要 集中 在 理论 分 析 与 实践 应 用 等 方面 的 模块 化 分 析 ， 暂 时 还 没有 进行 系统 的 综 
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概念 界定 


内 涵 要 素 


比较 研究 
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尼 酒 杯 模型 、 互 动 演示 幻 
灯 片 模型 、 下 钻 式 叙事 模型 
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管理 者 预测 性 分 析 ANER Be 
专家 规范 性 分 # E a 
ATE 探索 性 数据 分 析 = | 
数据 故事 视角 下 用 户 数据 故事 的 数据 故事 化 实践 基于 结果 的 数据 数据 故事 的 工程 化 
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1 数据 故事 化 的 研究 框架 


2 数据 故事 化 的 内 涵 研 究 


2.1 概念 界定 


因此 ， 本 文 在 详细 梳理 我 国 现 有 的 21 篇 有 关 数 据 故 事 化 研 
“数据 故事 化 ”的 概念 内 涵 、 基 本 流程 、 相 关 模 型 以 及 实践 应 
昌 〈 见 图 1) ， 以 对 我 国 数据 故事 化 的 研究 进展 进行 全 面 的 剖析 。 


目前 国内 学 者 对 于 数据 故事 化 的 概念 界定 各 有 侧重 ， 本 文通 过 对 现 有 文献 分 析 后 ， 
认为 数据 故事 (Data Story) 是 一 种 数据 驱动 的 故事 形式 ， 解 决 了 特定 的 业务 需求 ， 使 用 
数据 作为 输入 ， 应 用 数据 分 析 和 建 模 技术 ， 从 数据 中 提取 有 价值 的 见解 ， 并 以 故事 的 形 
式 传 达 给 目标 受众 叶 。 而 数据 故事 化 (Data Storytelling) 本 质 上 就 是 从 数据 到 数据 故事 的 


一 个 转化 过 程 ， 是 以 “故事 ”的 形式 呈现 对 “数据 的 理解 ”。 在 数据 故事 化 中 ，“ 数 据 ” 
被 缩小 或 与 特定 情况 相关 ， 并 以 叙述 的 形式 呈现 ， 使 其 更 容易 理解 、 记 忆 和 消化 28。 数 据 
故事 是 数据 故事 化 的 最 终 形态 ， 是 一 种 文学 体裁 ， 其 中 数据 是 叙事 的 主体 ， 数 据 的 客观 
性 和 叙事 的 主观 性 形成 一 个 整体 。 对 许多 人 来 说 ， 关 于 数据 的 故事 比 数据 本 号 更 容易 被 记 
住 、 感 知 和 体现 出 来 。 
2.2 内 涵 要 素 

根据 朝 乐 门 2 的 研究 ， 数 据 故 事 化 主要 涵盖 了 三 个 关键 因素 : 数据 、 可 视 化 和 叙述 
〈 见 图 2) 。 在 数据 故事 化 的 过 程 中 经 常会 用 到 数据 可 视 化 技术 ， 但 重要 的 是 不 只 是 将 图 
形 呈 现 出 来 ， 而 是 逐步 引导 人 们 认识 和 理解 数据 ， 并 从 数据 中 得 出 结论 。 将 数据 与 可 视 化 
相 结合 ， 可 以 提供 数据 的 视觉 表现 ， 让 其 他 人 更 好 地 理解 数据 并 从 数据 集中 得 到 更 多 的 
认识 。 当 在 解释 数据 的 过 程 中 应 用 叙述 时 ， 可 以 让 人 们 更 好 地 了 解 到 数据 中 发 生 的 事情 ， 
并 理解 其 背后 隐藏 的 信息 。 当 把 可 视 化 与 叙述 结合 在 一 起 时 ， 可 以 吸引 他 人 ， 以 一 种 更 容 
易 理 解 和 接受 的 方式 来 吸引 受众 。 而 当 有 价值 的 数据 、 有 效 的 可 视 化 和 熟练 的 讲 故事 方式 
结合 在 一 起 时 ， 一 个 关于 数据 的 引人入胜 的 故事 就 产生 了 。 


数据 故事 化 


图 2 数据 故事 化 三 要 素 

2.3 数据 故事 化 与 数据 叙事 的 比较 研究 
通过 分 析 现 有 文献 发 现 我 国学 者 主要 把 Data Storytelling 理解 为 “数据 故事 化 ”与 

“数据 叙事 ”两 个 内 涵 角 度 。 本 文 整理 归纳 了 一 些 代 表 性 的 相关 研究 〈 见 表 1) ， 认 为 
“数据 故事 化 ”与 “数据 叙事 ”并 列 ， 是 一 种 呈现 数据 的 方式 。 数 据 故 事 化 更 侧重 于 关 
注 新 技术 环境 下 的 组 织 和 数据 表达 创新 ， 并 提供 了 一 条 通过 可 视 化 将 数据 意识 深化 为 数 
据 认 知 的 途径 ， 而 数据 叙事 则 更 注重 分 析 数 据 中 的 事件 、 背 景 和 人 物 等 元 素 ， 以 描述 数据 
之 间 的 隐 性 关系 并 传达 相关 信息 。 但 这 两 个 概念 在 本 质 上 是 相同 的 ， 其 基本 思想 是 利用 茶 
些 技术 方法 和 策略 来 重 构 数据 的 故事 化 。 

表 1 数据 故事 化 与 数据 叙事 


内 容 
EM” | 研究 了 美国 的 开放 数据 平台 案例 并 提出 了 政府 开 
放 数 据 故事 化 的 运行 模式 。 


孙 智 中 ” | 研究 了 数据 故事 化 的 评价 要 素 3 
的 数据 故事 化 评价 模型 。 


Fal a 研究 了 数据 故事 化 在 数据 新 闻 中 的 应 用 案例 3 
出 了 数据 故事 化 实践 路 径 的 理论 模型 。 


XZ) 开 究 了 数据 故事 化 是 如 何 讲 好 红色 档案 故事 的 。 


开 究 了 疫情 数据 故事 化 的 要 素 结构 、 系 统 结构 以 
及 层级 结构 并 提出 了 疫情 数据 故事 化 的 实现 过 程 。 
四 故事 化 中 的 数据 关键 特征 并 提出 在 关 
寺 征 视角 下 的 效率 和 质量 评价 。 


了 一 些 数据 叙事 驱动 的 馆藏 利用 模型 并 提出 
基本 架构 。 


事 在 解决 数据 新 闻 现 存 问题 的 路 径 。 


中 叙事 的 关键 技术 。 


研究 了 数据 叙事 的 基本 要 素 与 不 同 的 叙事 策略 可 
以 应 用 的 场景 。 


Big PB 


基于 OW 传播 模式 基础 提 H 
型 并 研究 了 其 运行 中 的 关键 问题 。 


As bts oA 25 
研究 了 数据 叙事 的 应 用 情境 与 实现 路 径 。 


Data 研究 人 员 研究 侧重 点 
Storytelling 


侧重 于 新 技术 环 
境 下 的 数据 构成 
和 呈现 层面 的 创 
新 。 


侧重 于 如 何 利 用 
叙事 策略 对 数据 
中 的 事件 、 背 景 、 
人 物 和 其 他 元 素 
进行 分 解 和 连接 。 


基本 思想 均 在 于 通过 一 定 的 技术 方法 及 策略 完成 数据 的 故事 化 重 塑 


2.4 理论 基础 


数据 故事 化 的 研究 需要 对 其 他 相关 领域 的 研究 基础 进行 借鉴 ， 本 文通 过 总 结 归纳 现 
有 文献 ， 认 为 数据 故事 化 的 理论 基础 主要 涉及 数据 科学 、 认 知 科学 、 数据 可 视 化 、 可 解释 性 


机 器 学 习 和 自然 语言 处 理 五 个 领域 ( 见 表 2) ， 表 中 简要 阐述 了 其 他 各 个 领域 研究 与 数据 


F 


故事 化 之 间 的 联系 ， 分 析 其 是 如 何 支撑 数据 故事 化 的 研究 ， 并 对 其 之 间 的 联系 进行 了 图 


ZN REAR © 
He 2 数据 故事 化 的 理论 基础 
理论 基础 联系 图 示 


参考 文献 


数据 科学 ”数据 科学 专注 于 数据 处 理 、 计 算 、 管 理 、 分 TRE, 


析 和 数据 产品 开发 等 关键 活动 ， 为 数据 故 er 
事 化 的 过 程 提供 了 启示 与 技术 背景 ， 数 据 数据 故 | |e 
故事 化 从 学 科 归 属 上 来 看 是 属于 数据 科学 ais s 
的 一 部 分 。 

认 知 科学 认 知 科学 关注 的 是 信息 如 何以 感觉 语言 、 张 晨 ， 
注意 力 、 推 理 和 情感 的 形式 呈现 ， 数 据 故 ae 
事 化 认 知 过 程 的 每 个 阶段 都 需要 认 知 科学 
的 理论 指导 。 

可 解释 性 机 ”可 解释 性 机 器 学 习 是 指 以 人 类 、 特 别 是 非 肖 纪 文 ， 
专业 人 十 能 够 理解 的 方式 来 表示 数据 的 能 

BMS 2023” 

二 力 ， 为 数据 故事 的 建 模 提供 了 重要 的 指导 i 
方针 ， 为 理解 算法 和 解释 数据 故事 中 的 结 。 | wm ae 
果 提供 了 一 个 理论 框架 Ue 

可 解释 性 机 器 学 习 

数据 可 视 化 。 数据 可 视 化 通过 一 些 可 视 的 方式 来 呈现 数 = EJE, 
据 ， 是 数据 故事 化 中 最 常用 的 叙事 工具 之 sass 
一 ， 可 视 化 技术 可 以 提高 对 数据 故事 的 理 。 
EJ o || sam aemm HESU 

数据 可 视 化 

自然 语言 处 ”自然 语言 处 理 的 主要 研究 目标 是 使 计算 机 朝 乐 门 ， 

能 够 理解 、 解 释 和 处 理 人 类 语言 ， 其 中 自 ee e ai 


E 然 语 言 理 解 将 输出 数据 处 理 成 机 器 可 读 的 。 更 
语义 表示 ， 是 数据 故事 化 建 模 的 关键 技术 È 
> 一; 自然 语言 生成 以 人 类 可 读 的 自然 语 

言 形 式 表示 语义 信息 ， 是 数据 故事 化 呈现 
的 关键 技术 之 一 。 


3 数据 故事 化 的 流程 研究 


数据 故事 化 本 质 上 属于 一 种 传播 信息 的 方式 ， 它 以 一 种 更 易于 受众 记忆 、 认 知 和 体验 
的 方式 将 数据 应 用 到 故事 化 的 整个 流程 中 。 基 于 现 有 的 文献 "> ， 本 文 将 数据 故事 化 
的 基本 流程 总 结 归 纳 为 六 个 基本 活动 : 了 解 受 众 、 数据 理解 分 析 、 故事 化 建 模 、 故 事 化 呈现 、 
故事 化 叙述 、 以 及 受众 反馈 ， 也 可 将 其 分 为 探索 数据 、 制 作 故 事 和 叙述 故事 三 大 部 分 〈 见 
图 3) 。 
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理解 生成 


了 | 受 
受 数据 分 k 
众 析 师 馈 
l BRIMIÐ aa 故事 化 建 模 | onua 故事 化 呈现 | 故事 化 叙述 EN 
数据 es 故事 要 素 ay 故事 情节 > 数据 故事 ae | 故事 评价 
探索 数据 制作 故事 叙述 故事 
图 3 数据 故事 化 的 流程 研究 
3.1 探索 数据 


数据 探索 涉及 一 系列 则 在 理解 和 分 析 数 据 的 活动 。 数 据 是 原材料 ， 关 于 数据 的 视觉 故 
事 的 内 容 就 是 从 这 里 产生 的 。 在 探索 数据 的 过 程 中 ， 首 先 要 细 分 受众 群体 ， 了 解 不 同 受 众 
群体 的 不 同业 务 需求 ， 再 由 数据 分 析 师 根据 受众 的 业务 需求 对 数据 进行 理解 分 析 ， 以 达 
到 洞 见 数据 隐藏 价值 的 目的 。 
3.1.1 了 解 受众 

了 解 受 众 群体 是 数据 故事 化 的 先决 条 件 。 孟 刚 等 * 在 考虑 受众 对 故事 的 了 解 程度 和 信 
息 获 取 能 力 的 基础 上 将 受众 划分 为 五 种 群体 ， 新手、 多面手、 管理 者 、 专家 和 执行 官 。 新 手 
通常 是 刚 接触 这 个 话题 ， 希 望 数据 故事 可 以 更 详细 地 展示 出 来 ， 为 新 手提 供 更 详细 和 更 
具体 的 信息 。 多 面 手 通常 对 当前 题 有 了 一 定 的 认 知 ， 但 寻求 一 个 概述 和 关键 问题 ， 更 多 的 
是 需要 关注 总 体 理解 和 核心 主题 。 管 理 者 通常 寻求 对 话题 细节 的 错综复杂 和 关系 的 深入 和 
实际 理解 。 专 家 通常 希望 对 所 研究 的 主题 有 更 多 的 了 解 ， 而 不 需要 深入 到 不 必要 的 细节 。 
执行 官 通常 只 需要 知道 概率 计算 的 结论 及 其 影响 ， 主 要 关注 重要 性 和 结论 。 

因此 ， 根 据 受众 的 范围 、 知 识 、 技 能 和 目标 ， 数 据 故 事 专家 必须 确定 故事 的 适当 背景 。 
这 意味 着 要 使 不 同 的 数据 故事 适应 不 同 的 数据 故事 业务 需求 ， 对 每 个 受众 进行 细 分 ， 了 
解 受 众 的 需求 ， 将 受众 群体 与 业务 需求 之 间 进 行 对 应 联系 ， 根 据 不 同 的 受众 选择 不 同 的 
数据 故事 和 内 容 呈 现 方式 ， 不 要 过 度 泛 化 ， 要 使 受众 能 够 准确 理解 并 感受 到 数据 的 价值 
( 见 表 3) 。 朝 乐 门 ”* 等 提出 业务 需求 主要 包括 建议 .描述 解释 劝说、 调查 、 研 究 、 教 育 7 种 
类 型 。 建议 是 向 受众 推荐 产品 或 服务 的 过 程 ,描述 是 向 受众 解释 数据 或 信息 的 过 程 ,解释 是 
向 受众 解释 想法 和 结论 的 过 程 。 劝 说 是 说 服 听众 接受 茶 种 想法 或 观念 的 过 程 。 调 碍 是 向 受 


众 收集 用 户 数据 和 意见 的 过 程 。 研 究 是 通过 受众 的 参与 来 了 解 商业 和 产品 创新 与 优化 的 过 


程 。 教 育 是 让 受众 掌握 知识 和 技能 的 过 程 。 


表 3 受众 群体 与 业务 需求 之 间 的 对 应 联系 
业务 需求 种 类 


受众 群体 需求 内 容 

新 手 寻求 数据 故事 能 够 详细 展示 ， 和 希望 
提供 更 详细 和 具体 的 信息 。 

多 面 手 寻求 一 个 概述 和 关键 问题 ， 需 要 关 
注 总 体 理解 和 核心 主题 。 

管理 者 寻求 对 话题 细节 的 错综复杂 和 关系 
的 深入 和 实际 理解 。 

专家 寻求 对 所 研究 的 主题 有 更 多 的 了 解 
而 不 需要 深入 到 不 必要 的 细节 。 

执行 官 寻求 知道 概率 计算 的 结论 和 其 影响 
主要 关注 重要 性 和 结论 。 

3.1.2 数据 理解 分 析 


解释 /推荐 


描述 /研究 


劝说 /研究 


调查 /研究 


劝说 /教育 


数据 理解 实际 上 是 进行 数据 故事 化 的 第 一 步 ， 它 本 质 上 就 是 对 数据 进行 分 析 。 数 据 故 
事 与 文学 故事 的 一 个 主要 区 别 也 是 数据 理解 .本 文通 过 分 析 现 有 的 文献 31227， 发 现在 数据 
故事 化 中 常用 于 数据 分 析 的 方法 有 四 种 : 描述 性 分 析 (Descriptive Analytic) 、 诊 断 性 分 析 
(Descriptive Analytic) 、 预 测 性 分 析 (Descriptive Analytic) 和 规范 性 分 析 (Descriptive 


Analytic) 四 种 〈 见 图 4) 。 


URE SATA? 为 什么 发 生 的 ? 将 要 发 生 什 么 ?我 们 如 何 使 它 什么 ? 


后 见 el 预见 


4 数据 分 析 的 四 种 方法 


描述 性 分 析 侧 重 于 “过 去 ”， 作 为 数据 分 析 的 第 一 步 ， 回 答 “ 发 生 了 什么 ”的 问题 。 
诊断 性 分 析 侧 重 于 “过 去 ”， 回 答 “为 什么 会 发 生 ” 的 问题 ， 作 为 对 描述 性 分 析 的 进 一 
步 理 解 。 预 测 性 分 析 关 注 “ 示 来 ”， 回 答 “ 会 发 生 什么 ”的 问题 ， 作 为 规范 性 分 析 的 基础 。 
诊断 性 分 析 侧 重 于 “过 去 ”， 并 回答 “为 什么 会 发 生 ” 的 问题 ， 这 是 描述 性 分 析 的 男 一 
种 理解 。 预测 性 分 析 侧重 于 “未 来 ”， 回 答 “ 会 发 生 什 么 ”的 问题 ， 是 规范 性 分 析 的 基 
础 。 在 进行 上 述 四 种 数据 分 析 的 基础 上 ， 需 要 进一步 进行 探索 性 数据 分 析 (Exploratory 
Data Analysis, EDA) ， 以 便 达 到 更 好 地 理解 数据 的 目的 。 探 索性 数据 分 析 指 的 是 则 在 识 


7 


chinaXiv:202303.09944v1 


别 基 础 数据 中 的 模式 和 趋势 的 数据 分 析 活动 。 

在 数据 理解 分 析 的 过 程 中 ， 数 据 分 析 师 还 需要 运用 分 析 模 型 来 对 业务 需求 进行 描述 。 
运用 分 析 模 型 就 是 将 数据 与 业务 需求 相 结合 的 过 程 ， 即 为 了 将 数据 转化 为 故事 而 进行 的 
统计 分 析 ， 包 括 了 许多 机 器 学 习 模 型 ， 通 常 有 分 类 模型 、 聚 类 模型 、 回 归 模 型 、 关 联 规则 模 
型 和 降 维 模型 等 ">o"。 

3.2 制作 故事 

制作 故事 涉及 以 故事 化 建 模 与 故事 化 呈现 为 中 心 的 一 系列 活动 。 创 作者 需要 将 故事 放 
在 受众 的 业务 领域 、 知 识 、 技 能 和 目标 的 背景 下 ， 根 据 其 定制 各 种 数据 故事 ， 使 其 易于 理 
解 。 为 了 制作 一 个 故事 ， 数 据 改 事 专家 需要 将 第 一 步 中 数据 分 析 师 提取 出 来 的 故事 要 素 进 
行 故事 化 建 模 形成 故事 模型 ， 然 后 通过 形式 化 描述 将 其 组 合成 一 个 有 趣 、 富 有 启发 性 和 下 
人 入 胜 的 故事 情节 ， 再 通过 一 定 的 可 视 化 技术 呈现 出 来 ， 生 成 可 以 叙述 传播 的 数据 故事 。 
3.2.1 故事 化 建 模 

从 数据 到 故事 模型 的 转化 是 数据 故事 化 的 关键 活动 "”。 故 事 模型 是 故事 创造 者 和 叙述 
者 之 间 的 桥梁 。 在 了 解 受众 以 及 理解 和 分 析 数据 等 活动 之 后 ， 需 要 对 数据 故事 进行 建 模 
( 见 图 5) 。 数 据 故 事 建 模 的 一 个 重要 部 分 是 确定 数据 故事 的 组 成 部 分 ， 建 立 并 验证 各 元 
素 之 间 的 内 部 关系 ， 并 确定 不 同 故 事 之 间 的 关系 ， 这 包括 确定 数据 故事 的 要 素 ， 即 数据 
故事 的 七 个 基本 要 素 人 物 、 需 求 、 情 节 、 情 境 、 冲突 、 解 决 方案 和 下 一 步行 动 ) ， 建 立 并 验 
证 数据 故事 各 要 素 之 间 的 内 部 关系 ， 即 其 他 以 冲突 为 基础 ， 组 织 数据 故事 的 六 个 要 素 ， 
分 析 内 部 关系 ， 验 证 各 要 素 之 间 的 一 致 性 ， 并 建立 不 同 故 事 之 间 的 联系 ， 并 将 其 联结 起 
来 ， 再 代入 故事 模型 就 可 以 形成 一 个 完整 的 故事 。 


故事 化 建 模 


BRAS 事件 联结 故事 模型 
要 素 一 一 一 > 事件 一 一 一 一 情节 于 一 一 一 3| 故事 


N 


| 需求 人 物 

| AXZ How( 如 何 ) Whos) 

| TS 情境 

| re KR Where( 哪 里 ) pil What 什么) 
| DR ZS 情节 When( 什 么 时 候 ) Why( 为 什么 ) 


吸引 受众 的 故事 和 句子 


要 解决 的 问题 或 疑问 
解决 问题 的 方法 ~ 
实施 该 解决 方案 的 好 处 | 模 
人 | | 型 


图 5 故事 化 建 模 过 程 

故事 模型 主要 描述 的 故事 要 素 及 要 素 之 间 的 结构 关系 "227"， 比 较 有 代表 性 的 如 下 : 
(1) 5WIH 模型 假设 数据 故事 必须 包含 六 个 元 素 : Who CHE) 、What (什么 ) 、Why (为 
ITA) „When (什么 时 候 ) 、Where 〈 哪 里 ) 和 How (如何 ) 。 Who( 谁 》 对 应 数据 故事 的 
BURA, What UTA) WRI AAA, Why (为 什么 ) 对 应 讲述 数据 故事 的 
原因 ，When〔 什 么 时 候 ) 对 应 数据 故事 发 生 的 时 间 ，Where ORE) 对 应 数据 故事 发 生 
的 地 点 ，How〔 如 何 ) 对 应 数据 故事 是 如 何 发 生 的 。(2〉SPSN 模型 描述 了 故事 的 要 素 和 
结构 模型 ， 认 为 数据 故事 包括 的 要 素 及 其 描述 顺序 依次 为 ，Situation (情境 ) ~ Problem 
CEE) ~ Solution (解决 方案 ) ~ Next Steps 〈 下 一 步行 动 ) 。 情 境 是 指数 据 故 事 叙 述 者 向 
听众 描述 故事 发 生 的 情况 以 及 他 /她 想 要 改变 的 初始 状态 ， 问 题 指 的 是 解决 讲 故事 者 最 初 
情况 下 的 问题 或 痛 点 ; 解决 方案 指 的 是 提出 的 解决 方案 ; 下 一 步 指 的 是 数据 氢 述 者 和 受 
众 要 采取 的 行动 。(3) 五 步 叙 事 模型 指出 数据 故事 的 基本 要 素 和 结构 主要 包括 五 个 内 容 : 
吸引 受众 的 故事 和 句子 ， 要 解雇 的 问题 或 疑问 ， 提 出 解决 问题 的 方法 ， 描 述 实 施 该 解决 
方案 的 具体 好 处 ， 并 呼吁 采取 行动 。 
3.2.2 故事 化 呈现 

从 故事 模型 到 故事 的 叙述 也 是 数据 故事 化 的 关键 活动 "。 张 晨 ? 等 提出 故事 化 的 呈现 方 
式 主要 分 为 两 种 类 型 ， 即 视觉 呈现 和 文本 呈现 。 视 觉 呈 现 强 调 基于 数据 可 视 化 的 数据 故事 
化 的 重要 性 ， 一 般 数据 占 较 大 比例 ， 是 一 种 视觉 驱动 的 方式 ， 主 要 应 用 于 分 析 、 探 索 和 解 

; 而 文本 呈现 则 侧重 于 利用 非 可 视 化 的 实现 方式 将 数据 置 于 特定 的 叙事 背景 中 ， 具 有 
更 强 的 文学 性 ， 一 般 数 据 占 比比 较 小 ， 是 一 种 听觉 驱动 的 方式 ， 主 要 应 用 于 描述 和 解释 。 

基于 现 有 文献 3%， 笔 者 本 文 总 结 归纳 出 支持 视觉 呈现 的 关键 技术 包括 注释 、 图 表 自 
动 生成 、 可 视 化 等 技术 ,支持 文本 呈现 的 包括 自然 语言 生成 和 文本 转换 等 技术 。 结 合 视 觉 
和 文本 两 种 方式 来 创造 和 呈现 故事 产品 的 技术 包括 富 媒体 、 人 机 互动 、 虚 拟 现 实 和 增强 现 
实 等 技术 ( 见 图 6) 。 


注释 技术 e 
m am x 
WEER REER 可 视 化 技术 ly 
| eu 
i was 
自然 语言 生成 技术 文本 转换 技术 ( E 
文本 呈现 H 语音 = 
术 


6 支持 故事 化 呈现 的 关键 技术 
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在 视觉 呈现 的 过 程 中 ， 通 常会 创建 出 一 个 信息 图 表 或 是 生成 一 个 图 像 。 在 这 个 过 程 中 ， 
想 要 创建 出 信息 图 表 的 关键 就 是 要 选择 正确 的 图 表 来 表达 数据 ， 而 对 特定 图 表 的 选择 取 
决 于 故事 创作 者 的 目标 和 数据 的 类 型 。 利 用 图 表 自 动 生成 技术 可 以 输出 自 定义 或 自动 推荐 
的 视觉 图 表 类 型 ， 然 后 根据 用 户 输入 的 数据 创建 信息 图 表 。 注 释 技 术 可 以 用 来 为 信息 图 表 
添加 图 形 或 文字 标签 ， 以 直观 地 突出 重要 的 特征 或 数据 元 素 ， 并 促进 对 可 视 化 结果 的 特 
定 区 域 的 理解 和 解释 。 此 外 ， 还 可 以 利用 可 视 化 技术 ， 将 它 用 于 特定 的 界面 中 以 来 表达 可 
视 化 的 元 素 ， 然 后 允许 用 户 通 过 选择 、 改 变 、 调 用 和 转移 可 视 化 界面 元 素来 改变 界面 表示 
结果 ， 并 提供 不 同 的 图 像 生成 技术 的 视角 。 

在 文本 呈现 的 过 程 中 ， 通 常会 形成 一 些 文 本 或 者 语音 。 在 这 个 过 程 中 ， 可 以 利用 自然 
语言 生成 技术 将 一 些 星 涩 难 懂 的 数据 故事 模型 生成 一 段 人 类 可 理解 的 自然 语言 文本 或 者 
对 数据 故事 进行 补充 描述 。 此 外 ， 还 可 以 利用 文本 转换 技术 对 生成 的 文本 进行 语言 分 析 使 
其 生成 一 段 语 音 ， 其 本 质 上 就 是 将 文本 输入 转化 成 语言 输出 的 一 种 自动 化 技术 。 

数据 故事 化 的 依托 载体 和 生成 结果 为 数据 故事 产品 ， 因 此 数据 故事 化 的 过 程 也 是 开 
发 和 使 用 数据 故事 会 产品 的 过 程 。 可 以 利用 富 媒体 技术 、 人 机 交互 技术 、 虚拟 现实 或 增强 现 
实 技术 将 视觉 呈现 与 文本 呈现 结合 在 一 起 ， 形 成 的 最 终 产 品 可 以 是 动态 或 静态 、 单 页 叙述 
或 互动 研究 的 形式 ， 例 如 ， 图 像 、 报 告 、 音 频 、 视 频 、 动 画 等 。 富 媒体 技术 是 指使 用 各 种 技术 ， 
主要 是 图 像 、 动 画 、 音 频 \、 视频, 脚本 代码 和 标记 语言 ， 来 创造 各 种 广告 产品 电影 产品 或 网 
络 内 容 ， 让 用 户 可 以 与 之 互动 。 基 于 人 机 互动 的 数据 故事 ， 涉 及 受众 和 计算 机 之 间 的 互动 ， 
以 完成 一 个 学 习 过 程 ， 计 算 机 可 以 收集 用 户 数据 并 提供 适当 的 反馈 。 虚 拟 现实 技术 可 以 通 
过 赋予 数据 场景 新 的 虚构 现实 ， 让 受众 沉浸 其 中 ， 从 而 传达 出 数据 场景 的 本 质 。 增 强 现 实 
技术 可 以 对 原始 数据 场景 进行 优化 和 调整 ， 将 其 置 于 一 个 真实 的 环境 中 ， 以 3D 方式 讲述 
故事 ， 通 过 让 观众 沉浸 在 场景 中 的 能 力 来 吸引 他 们 ， 并 为 数据 产品 创造 一 个 更 好 的 体验 。 
3.3 叙述 故事 

叙述 故事 涉及 以 故事 化 叙述 以 及 受众 反馈 为 中 心 的 一 系列 活动 。 首 先 故 事 叙 述 者 可 以 
用 各 种 讲 故 事 的 方式 向 受众 叙述 传播 数据 故事 ， 受 众 再 根据 自己 感知 对 数据 故事 进行 评 
价 ， 最 后 将 受众 的 评价 反馈 给 创作 者 。 

3.3.1 故事 化 叙述 

从 故事 的 叙述 者 与 受众 之 间 的 驱动 关系 看 ， 数 据 故 事 的 叙述 者 可 采用 的 叙述 方法 有 

叙述 者 驱动 型 叙述 方法 和 受众 驱动 型 叙述 方法 。 (1) 叙述 者 驱动 型 叙述 的 重点 是 向 观众 
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提供 数据 ， 叙 述 者 在 讲 故事 的 过 程 中 主要 是 走 直线 ， 不 给 观众 与 图 表 的 互动 ， 数 据 和 可 
视 化 的 内 容 由 叙述 者 选择 ， 并 作为 成 品 呈 现 给 读者 与 观众 ， 在 这 个 过 程 中 ， 受 众 一 般 都 
是 被 动 接受 的 ， 这 是 一 种 片面 的 展示 、 交 流 和 获得 接受 的 方法 。 这 种 技巧 经 常用 于 叙述 者 
作为 主要 演员 的 活动 中 ， 如 电影 、 书 籍 和 杂志 、 广 告 和 商业 演示 ， 其 目的 是 为 了 有 效 沟通 
让 他 人 接受 确定 性 的 信息 。 O) 受众 驱动 型 叙述 强调 与 观众 的 高 度 接 触 ， 并 为 读者 提供 
处 理 数据 的 机 会 。 讲 故事 的 人 负责 提供 数据 及 其 可 视 化 方法 ， 而 不 是 简单 地 告知 观众 并 依 
靠 严 格 的 结构 化 叙事 结构 ， 观 众 通过 图 形 化 的 可 视 化 结构 和 形成 他 们 自己 的 叙事 流程 来 
参与 到 这 个 过 程 。 在 这 个 过 程 中 ， 受 众 一 般 都 是 主动 的 接受 。 数 据 故 事 的 叙述 需要 在 讲 故 
事 的 人 主导 的 叙述 和 受众 主导 的 叙述 之 间 取 得 平衡 。 讲 故事 的 人 向 听众 提供 结构 化 的 叙述 ， 
但 互动 仍然 是 可 能 的 。 

在 故事 叙述 者 向 受众 叙述 故事 的 过 程 中 还 应 用 到 了 叙事 模型 ,叙事 模型 是 用 来 向 目 
标 受 众 讲述 故事 的 模型 ”336。 同一 故事 模型 可 以 存在 多 个 叙事 模型 ， 以 便 使 叙事 个 性 化 。 
在 进行 叙述 者 驱动 型 叙述 时 可 以 运用 例如 马 提 尼 酒杯 模型 和 SUCCES 模型 等 叙事 模型 ， 
在 进行 受众 驱动 型 叙述 时 可 以 运用 例如 互动 演示 约 灯 片 模型 和 下 钻 式 叙事 模型 等 叙事 模 
型 〈 见 表 4) ,叙事 需要 一 个 讲 故 事 的 过 程 ， 以 确保 故事 具有 和 急 事 的 品质 。 叙事 模型 将 故事 
模型 作为 目标 受众 个 性 化 叙事 的 输入 模型 ， 也 是 数据 故事 化 过 程 中 的 最 终 模型 。 

表 4 叙述 类 型 与 叙事 模型 


叙述 类 型 叙事 模型 形式 内 容 

AYIA 了 U1, +8 N 模型 E E ae y ae 事 模型 ， 

ae ene an aeons 这 个 过 程 中 ， 创 作者 首先 根据 数据 分 析 建立 

动 型 叙述 Be te te a 一 个 完整 的 数据 故事 ， 然 后 由 讲 故 事 的 人 将 
, E 建立 的 故事 呈现 给 观众 ， 传 达 创作 者 的 观点 ， 
阔 的 颈 部 代表 读者 参 、、 a 
eae 并 为 观众 提供 一 个 观点 引发 讨论 ， 让 听众 开 


台 讨论 现 有 的 数据 故事 并 自由 提问 以 便 探 讨 。 


简单 是 指 把 重点 放 在 真正 需要 和 想 要 传达 的 
最 重要 的 信息 上 ， 并 保持 短小 精 悍 ， 减 少 理 
解 和 记忆 的 难度 。 惊奇 是 指 打 乱 观众 的 理解 ， 
使 情节 或 内 容 出 人 意料 、 令 人 惊讶， 以 吸引 观 
众 的 注意 力 。 其 体 是 指 提供 上 基体 的 例子 或 具体 
的 细节 ， 使 故事 更 清晰 ， 更 容易 理解 。 可 信 指 
的 是 需要 用 可 靠 的 来 源 来 文 持 叙 述 者 的 说 法 ， 
并 使 用 公开 的 数据 和 外 部 证 实 来 使 故事 更 加 
可 信 , 情感 是 指 娴熟 地 使 用 一 系列 的 情感 ， 如 
快乐 、 斐 伤 、 鸭 惧 、 惊 讶 愤怒 、 担 忧 、 爱 和 恨 等 


SUCCESs 模 型 ”遵循 SUCCESs 原则 
(简单 .惊奇 、 具 体 、 信 
任 和 情感 ) 。 


模型 


下 钻 式 叙事 模型 


3.3.2 受众 反馈 
孙 智 中 ”等 对 数据 故事 化 的 评价 与 改进 i 


互动 演示 幻灯 片 ” 是 一 种 让 创作 者 和 观 


众 参 与 到 故事 讲述 过 
程 中 的 方式 。 


以 受众 为 中 心 ， 呈 现 
出 数 页 的 数据 可 视 化 
结果 ， 让 受众 自己 决 
定 他 们 想 看 哪些 细节 
和 故事 趋势 。 


来 丰富 故事 本 身 ， 


起 观众 的 共鸣 。 


这 


达 的 意图 ， 如 果 有 必要 ， 可 
的 每 个 阶段 ， 以 便 更 好 地 理 


增加 故事 的 吸引 力 ， 以 引 


方法 可 以 让 听众 更 好 地 理解 创作 者 所 传 


以 回顾 数据 叙述 


解 复杂 的 数据 集 


和 数据 叙述 的 创建 过 程 。 


在 这 种 i 


故事 的 模式 中 ， 创 作者 让 受众 选择 


他 们 想 深 入 了 解 的 故事 ， 而 受众 则 决定 他 们 


想 了 解 的 故事 。 


FE 行 了 研究 ， 通 过 分 析 本 文 认为 数据 故事 化 的 


结果 应 该 与 业务 需求 进行 比较 和 分 析 ， 受 众 应 该 能 够 根据 自己 的 看 法 对 数据 故事 进行 评 
价 ， 这 样 他 们 就 可 以 与 创作 者 进行 互动 ， 并 提出 进一步 持续 改进 的 建议 。 数 据 故事 化 不 是 
涉及 规划 、 实施 、 评 价 和 改进 等 关键 行动 。 


一 个 一 次 性 的 活动 ， 而 是 一 个 循序 渐进 的 过 程 ， 


4 数据 故事 化 的 模型 研究 


在 数据 故事 化 的 研究 过 程 中 ， 国 内 学 者 也 提出 了 一 些 可 月 
数据 故事 化 的 理论 模型 可 以 帮助 组 织 厘 清 复杂 或 模糊 的 概念 ， 梳 理 
究 者 了 解 其 研究 内 容 ， 还 有 利于 数据 利益 相关 者 从 中 


用 模型 与 开发 模型 等 。 
出 相关 基础 理论 的 内 容 ， 有 利于 而 


获取 信息 ， 进 而 做 出 正确 的 决 集 ; 
的 参考 ， 同 时 为 数据 故事 化 的 实现 提供 了 完整 的 到 


模型 ， 包 括 有 理论 模型 、 应 


应 用 模型 为 数据 故事 创作 者 的 创作 过 程 提供 了 模型 化 
论 路 径 ， 开 发 模型 为 数据 故事 的 自动 


生成 提供 了 方法 ， 并 为 数据 故事 产品 的 开发 提供 了 软件 工程 指导 ， 可 以 推动 数据 故事 工 


5) 。 


模型 
数据 故事 视角 
下 用 户 认 知 图 
式 联结 模型 


有 具 的 差异 化 发 展 及 产业 生态 的 培育 。 本 文 着 习 


提出 者 
T 
19Error: 
Reference 

source not 


found 


表 5 我 国 数据 故事 化 模型 比较 


组 成 
模型 由 八 种 用 户 认 知 
图 式 与 认 知 图 式 的 联 
结 过 程 、 反 应 及 结果 组 
成 。 


功能 


户 数据 认 知 


有 利于 研究 者 了 解 用 
的 需求 ， 


并 为 数据 故事 的 采纳 
提供 了 理论 基础 。 


EE 分 析 了 其 中 几 个 具有 代表 性 的 模型 R 


异同 与 适用 
与 其 他 模型 不 同 ， 它 
只 适用 于 数据 故事 化 
的 开端 ， 用 来 了 解 用 
户 的 认 知 需求 。 


事 By g’ 金字 塔 模 | = sp ee 
SORES MAUT 模型 从 下 到 上 由 业务 、 为 数据 故事 创作 者 的 SEEN SRE 
字 塔 模型 E oe : ti 径 理 论 模 型 都 适用 于 
SAR ME TARE WOR 创作 过 程 提供 了 模型 效 扣 故事 化 的 整个 创 
模型 、 故 事 描述 、 故 事 ” 化 的 参考 。 ong ee 
叙述 以 及 受众 行为 组 作 过 程 ， 但 其 组 成 内 
容 并 不 相同 。 
、 AET 模型 从 人 氢 事 声音 、 多 源 为 数据 故事 化 的 实现 
a 数据 、 视 觉 效果 、 叙事 ”提供 了 完整 的 理论 路 
~ WH. SRM 412. 
助 信息 6 个 维度 构建 
组 成 。 


模型 主要 由 外 部 变量 、 为 数据 故事 化 的 效果 与 其 他 模型 不 同 ， 它 

感知 变量 以 及 意向 变 评价 提供 了 方向 角度 只 适用 于 数据 故事 化 

量 三 大 部 分 组 成 。 指导 ， 有 利于 对 数据 的 结尾 ， 用 评价 数据 
故事 化 进行 改进 。 故事 化 的 效果 ， 


+ 工 小 Py 26 
nie WORT" 。 模 理由 数据 层 、 分 析 洞 “为 数据 故事 的 自动 生 与 其 他 模型 不 同 ， 它 
ie) 察 层 、 故 事 模型 层 、 故 “成 提供 了 方法 ， 并 为 “是 在 金字 塔 模型 的 基 
事 脚本 层 、 故 事 叙 事 层 ” 数 据 故 事 产品 的 开发 ” 础 上 构建 的 数据 故事 


基于 结果 的 数 。” 和 孙 智 中 ”? 
据 故 事 化 评价 
模型 


以 及 用 户 层 六 个 层级 提供 了 软件 工程 指导 ， 的 分 层 实现 和 组 件 化 
组 成。 可 以 推动 数据 故事 工 研发 的 参考 模型 ， 适 
具 的 差异 化 发 展 及 产 。 用 于 数据 故事 产品 的 
业 生 态 的 培育 。 工程 化 开发 。 
5 数据 故事 化 的 应 用 研究 


数据 存在 于 各 行 各 业 ， 包 括 政府 、 商 业 和 科学 研究 ， 而 数据 故事 化 会 使 研究 成 功 ， 并 
有 助 于 发 现 和 传播 各 种 领域 的 专业 知识 。 如 何 使 用 数据 ， 讲 述 什么 样 的 故事 ， 是 数据 故事 
化 会 发 挥 作用 的 原因 ， 并 有 助 于 其 纵向 和 横向 扩展 。 

本 文通 过 总 结 我 国 现 有 的 21 篇 文献 中 众多 学 者 提出 的 有 关 数 据 故 事 化 的 应 用 领域 ， 
认为 数据 故事 化 的 实践 应 用 主要 包括 社交 网 络 与 自 媒体 、 数 据 新 闻 传 播 、 商业 营销 推广 、 档 
RA Ai. Wee RO) 。 

表 6 数据 故事 化 实践 应 用 


实践 应 用 应 用 内 容 应 用 示例 
社交 媒体 网 络 = 疫情 情况 展示 "文博 展示 、 


在 开放 、 自 主 和 多 元 的 叙事 系统 中 ， 自 我 实现 的 媒体 内 容 
生产 者 自发 地 跟踪 当前 的 社会 事件 ， 解 释 数 据 ， 收 集 、 组 
合 和 传播 叙事 内 容 ， 从 观众 的 互动 反馈 中 提取 数据 并 产生 
共鸣 和 讨论 ， 创 造 新 的 叙事 视角 和 可 视 化 的 数据 产品 。 


影视 创作 、 社 会 记忆 二 


数据 新 闻 传 播 


新 闻 业 中 的 数据 故事 可 以 概括 为 如 何 获取 已 发 布 和 未 发 布 
的 数据 ， 编 辑 如 何 分 析 数 据 ， 以 及 如 何 将 数据 可 视 化 应 用 
于 新 闻 报 道 。 


商业 膏 销 推 在 商业 领域 扩大 数据 故事 的 应 用 ， 可 以 帮助 组 织 和 个 人 根 


据 数 据 的 可 靠 信息 做 出 决策 ， 并 利用 数字 媒体 增加 营销 活 
动 的 吸引 力 和 流量 。 


疫情 数据 传播 *、 政 府 


开放 


数据 ”、 数 据 新 闻 产 品 开发 
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商务 演示 ”、 市 场 营销 ”、 
数据 故事 产品 开发 、 数 据 故 


事 化 专用 工具 平台 ” 


色 档 案 资 源 内 容 挖掘 


y” 


W eit H BS oe 

BRAAI a Tree tt ee tire crt +2 eyo 
虚拟 .沉浸 ,互动 和 参与 式 的 讲 故事 形式 可 以 帮助 观众 更 好 

地 理解 档案 和 艺术 品 的 深层 人 文 意义 和 历史 ， 能 更 好 地 理 

解 。 


WAVES] 在 与 人 脑 和 认 知 行为 密切 相关 的 领域 ， 如 教育 和 娱乐 ， 数 
据 讲 故事 在 引导 人 类 交流 和 参与 方面 有 很 大 的 潜力 ， 是 帮 
助 解决 复杂 认 知 问题 的 重要 工具 。 
6 结论 与 展望 


本 文 前 述 了 我 国 目 前 有 关 数 据 故 事 化 的 研究 进展 ， 从 概念 内 涵 、 基 本 流程 、 相 关 模型 


内 容 挖掘 * 


里 ”问题 ?>、 学 术 交 流 


14 
` 


古籍 内 容 挖掘 、 博 物 馆 书籍 


解决 数据 科学 “最 后 一 英 


8 


以 及 应 用 实践 4 个 方面 对 我 国 数据 故事 化 的 研究 进展 进行 梳理 和 分 析 。 研 究 发 现 ， 我 国 现 


阶段 对 于 数据 故事 化 的 理论 探索 有 了 一 定 成 果 ， 但 仍然 存在 着 一 些 发 展 瓶颈 : 


ORE A 


关 数 据 故 事 化 的 研究 主要 以 跟踪 国外 的 研究 为 主 ， 缺 少 一 些 原创 性 的 研究 ; 包 目 前 的 研 


完 主 要 集中 在 理论 分 析 以 及 实践 应 用 等 方面 的 模块 化 分 析 ， 缺 少 一 


完整 的 数据 故事 化 


理论 体系 ;， 包 国内 学 者 提出 的 现 有 模型 主要 集中 在 理论 模型 上 ， 缺 少 面向 不 同业 务 需 求 
的 数据 故事 化 模型 的 设计 与 创新 ; 外 目前 的 数据 故事 化 还 是 主要 依赖 于 可 视 化 工具 ， 缺 


乏 开 发 专门 针对 支持 数据 故事 化 的 开源 工具 ; 名 目前 的 研究 只 提出 了 数据 故事 化 可 以 应 


用 的 领域 ， 但 缺乏 研究 数据 故事 化 在 茶 个 领域 的 具体 应 用 。 


为 解决 上 述 的 发 展开 贷 ， 未 来 的 研究 方向 可 以 注重 以 下 内 容 发 展 (D 完 善 数据 故事 
化 的 理论 体系 ， 进 行 系统 性 的 研究 ， 建 立 完整 的 知识 体系 ， 包 括 数据 故事 化 的 概念 、 理 论 、 
方法 、 技 术 、 工 具 和 实践 ; 包 优 化 数据 故事 化 的 算法 ， 探 索 数 据 故 事 化 的 新 模型 ， 开 发 适 


用 于 不 用 实践 场景 的 算法 和 模型 以 及 自动 调 参 的 方法 ;名 开发 专门 针对 于 数据 故事 化 受 


众 群 体 的 用 户 研 究 框 架 ， 更 准确 地 了 解 受众 群体 的 需求 ， 以 便 设计 出 更 具 效 果 的 数据 故 


F mo 在 当前 发 展 的 基础 上 ， 开 发 多 样 化 的 、 易 于 使 用 的 、 富 含 故事 和 情感 的 、 专 门 用 


于 数据 故事 化 的 方法 和 工具 。 鸟 在 相关 领域 扩大 数据 故事 化 的 应 用 范 


围 ， 如 政府 开放 数据 


故事 化 与 科研 数据 故事 化 等 ， 并 探索 数据 讲 故 事 的 具体 应 用 ， 以 提高 该 数据 的 可 理解 性 、 
逻辑 性 、 灵 活性 、 趣 味 性 和 可 读 性 ， 供 公众 再 使 用 。 
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Research progress in data storytelling in China: connotation, process, model, and 
application 
Liu Guifeng Wu Yaqi Liu Qiong 


Institute of Science and Technology Information, Jiangsu University 


Abstract: [Purpose/Significance] Data storytelling is a more efficient, comprehensive, and 
updated way to present data analysis results. By analyzing representative literature on data 
storytelling research in China, this paper systematically sorts out existing research results, and 
further prospects research trends, providing reference and inspiration for future research. 
[Method/Process] The content analysis method is mainly used to summarize the content of 21 
existing literature related to data storytelling research in China. The research progress of data 
storytelling in China is summarized and analyzed from four aspects: conceptual connotation, 
basic process, relevant models, and application practice. [Result/Conclusion] The research on 
data storytelling is still in its infancy in China, and there is significant room for improvement in 
theoretical research and practical applications such as content, processes, models, methods, and 
tools. Future research will focus on building an independent knowledge system and application 


practice system for data storytelling research in China. 
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